iT邦幫忙

2022 iThome 鐵人賽

DAY 6
0
AI & Data

【30天之新手學習筆記】PyTorch系列 第 6

Day 06 - 建立一個四軸張量儲存多張圖片資訊

  • 分享至 

  • xImage
  •  

昨天提到了利用三軸張量來儲存圖片資料,而今天的筆記主要講的是如何利用張量來儲存多張圖片,一張圖片的儲存主要是藉由 C X H X W 的三軸張量所構成,而在相同概念下我們則利用 N X C X H X W 的四軸張量來儲存多張的圖片資訊,其中N代表著資料集中的圖片數量,而它又稱作此四軸張量的批次軸(batch).

利用張量儲存多張圖片資訊

  1. 將所需的模組載入分別為numpy,torch,imageio,os
    https://ithelp.ithome.com.tw/upload/images/20220919/20152671UjluCrFqgl.jpg
  2. 設定一次可載入的圖片數量及利用dtype指定張量資料型別
    https://ithelp.ithome.com.tw/upload/images/20220919/20152671WSL9K76QFB.jpg
    這裡的張量數值型別我們設定為 torch.uint8,主要是因為相機的攝影格式是以八位元的正整數來表達每一種顏色的強度.
  3. 讀取圖檔所在的資料夾路徑,由於我們這裡是要讀取jpg檔,我們必須在程式內以'.jpg'來讀取
    由於我們在第二步設定了圖片的高度與寬度都為256像素,
    img_t = img_t[:3]這行則是要刪除圖片中可能存在的透明軸.
    https://ithelp.ithome.com.tw/upload/images/20220919/20152671qULwwPTqF0.jpg

在今天實作的過程中由於我沒有現成的圖片檔,因此我到google上找了幾張圖片來應用,在網路上的圖片像素的值通常都不會是 256 X 256 的格式,因此如果想要順利的應用,那麼就必須要先利用修圖軟體或是網路上能夠更改像素的相關資源對圖片進行修改,我一開始也沒注意到這點導致了錯誤,果然是新手哈哈哈.


參考資料:


上一篇
Day 05 - 將圖片資料利用張量表示
下一篇
Day 07 - 圖片資料進行神經網路計算前的處理
系列文
【30天之新手學習筆記】PyTorch30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言